查看原文
其他

斯坦福大学人工智能研究所:2019 人工智能指数报告

学术头条 2021-04-21

The following article is from 创新研究 Author 创研报告

来源:中国科协创新战略研究院《创新研究报告》
第11期(总第343期)2020-03-06

编者按:2019 年12 月,斯坦福大学人工智能研究所(Human-centered Artificial Intelligence Institute,以下简称HAI)发布了《2019 人工智能指数报告》(Artificial Intelligence Index 2019 Annual Report )。报告从学术研发、AI 会议、技术性能、经济、教育、自动系统、公众认知、社会伦理、国家战略和全球AI 活力九个方面分析了全球AI 的发展态势。该报告为斯坦福大学第三年发布的年度人工智能指数报告,是迄今为止关于人工智能较为全面的研究之一。本报告就其主要内容进行摘编。
近年来全球人工智能领域飞速发展。

1998—2018 年,经过同行评审的AI 论文(期刊论文和会议论文)增长了三倍以上。中国每年发表的AI 论文数量与欧洲持平,并于2006 年超过了美国。

2014—2018 年,全球60%以上的AI 专利引用来自北美地区。2019 年,全球私人AI 投资超过700 亿美元,AI 相关创业投资超过370 亿美元,并购规模340 亿美元,IPO 规模50 亿美元。

2010—2018 年,针对AI 初创公司的私人投资以超过48%的年均增长率稳步增长。当前,人工智能已成为北美计算机科学博士生最受欢迎的专业。2018 年,超过21%的计算机科学的博士毕业生专注于人工智能/ 机器学习的研究方向,超过60%的AI 博士毕业生进入了产业界。与此同时,人工智能相关的社会伦理问题逐渐引起人们关注,全球新闻报道涉及的主题主要有人工智能使用的伦理框架和准则、数据隐私、面部识别的使用、算法偏见等。

报告认为,人工智能对联合国所有17 个可持续发展目标均具有适用性,但只能帮助解决169 个细分目标中约一半的目标,因此需要克服一些瓶颈以便更好地发挥AI 的作用。

一、学术研发
1. 期刊出版物:Elsevier
据报告显示,1998—2018 年,AI 出版物在同行评审出版物中的占比不断提升,AI 论文占全球论文总数的比例从不足1%增长到3% 左右(在期刊出版物和会议论文中的占比已分别达到3% 和9%,图1)。欧洲在AI 论文发表数量上曾长期领先(2018年占全球份额达27%),而中国的AI 论文数量增长迅速,已于2006 年超过美国,目前与欧洲持平,在全球的占比从2000 年的10%增长到了2018 年的28%(图2)。但美国在AI 文献引用影响方面处于领先地位,欧洲接近全球平均水平,中国则进步较快。此外,企业与学术界合作开展AI 研究越来越普遍。



2. arXiv 上的论文
报告指出,2010—2019 年,arXiv 上AI 论文发表量增加了20 倍以上,“计算与语言”(Computation and language)子类的论文提交量增长了近60 倍。自2014 年以来,“ 计算机视觉和模式识别”(Computer Vision and Pattern Recognition)一直是最大的子类,2019 年“机器学习”(Machine Learning)则取而代之(图3)。以深度学习为例,北美发布的论文最多,其次是欧洲、亚太地区;按国别则是美国和中国排在前两位,其次是英国、德国、澳大利亚、加拿大;按人均论文发表量则是新加坡、瑞士、澳大利亚、以色列、荷兰和卢森堡相对较高。


3. 微软学术图谱(Microsoft Academic Graph,MAG)
据微软学术图谱数据显示,1990—2008 年,东亚及太平洋地区的AI 学术论文所占份额逐年上升,并于2003 年超过北美地区和欧洲及中亚地区。2018 年已发表的期刊论文中有37%来自东亚及太平洋地区,有24%来自欧洲及中亚地区,而22%来自北美地区(图4)。2015—2018 年,中国的AI 论文总发表量最多,其次是美国、印度、英国和德国。2014—2018 年,东亚及太平洋地区的AI 期刊论文引用量最多,占全球引用量的32.1%,其次是欧洲及中亚地区和北美地区,分别占31.4%和27.1%(图5)。



AI 技术专利可以衡量AI 在行业中的活动及其对产品的潜在影响。图6 显示了1990—2018 年全球MAG 在MAG 中的AI 专利份额。超过51%的已发布AI 专利归于北美,欧洲及中亚地区的份额下降到23%,与东亚及太平洋地区所占份额接近。2015—2018 年,AI 专利发布数量最多的是美国,其次是日本、法国、加拿大和德国;超过94%的AI 专利授权来自高收入国家,4% 来自中高收入国家。2014—2018 年,全球AI 专利引用量的60.4%来自北美地区,其次是东亚及太平洋地区和欧洲及中亚地区,分别为22.1% 和14.9%(图7)。



4. AI 研发中的女性研究人员
报告指出,AI 研究人员的性别多样性存在国际差异,地理位置和研究领域都会对此产生影响。2000—2018 年,拥有女性作者的AI 论文比例发生了变化,欧洲有所增长,而美国略有下降。许多西欧国家及阿根廷、加拿大和伊朗在AI 研究中都表现出了相对较高的女性比例。在荷兰和丹麦,至少有一位女性合著者的AI 论文比例分别在41%和39%以上,葡萄牙、西班牙、法国、比利时、意大利、爱尔兰、匈牙利、阿根廷、加拿大、伊朗等国家也有30% 以上,而日本和新加坡则只有10%和16%的AI 论文中有女性作者。

二、AI 会议
1. 参与度
报告显示,AI 会议的规模和声望都在提升,参会人数显著增加。神经信息处理系统大会(Conference and Workshop on Neural Information Processing Systems,NeurIPS)、计算机视觉与模式识别大会(Conference on Computer Vision and Pattern Recognition,CVPR)、国际机器学习大会(International Conference on Machine Learning,ICML)是与会人数最多的三个大型AI 会议,2019 年的参会人数分别达到了13500 人、9227 人和6400 人,NeurIPS 和ICML 的规模增长最快,均比2012年增长了8倍多,CVPR 也增长了5倍多。小型AI 会议如国际学习表征会议(International Conference on Learning Representations,ICLR),2019年的参会人数已是2014年的15倍以上。

2. 美国人工智能协会论文统计
美国人工智能协会(Association for the Advancement of Artificial Intelligence,AAAI)年会是运行时间较长的AI 会议之一。统计结果显示,AAAI 的会议论文中,中国提交和接受的论文最多,其次是美国;接受率最高的是以色列(24%),其次是德国(23%)、加拿大(22%)、美国(20%)和新加坡(20%)。从论文提交和接受的情况来看,机器学习、自然语言处理和计算机视觉仍是排名前三的主题领域。

3. 多元化组织
机器学习女性协会(Women in Machine Learning,WiML)作为一个支持女性参与机器学习研究和发展的组织,其2018 年研讨会的注册人数已是2014 年的8 倍多。致力于将科技工作者与学生进行对接的AI4ALL(AI for ALL)项目,其参与人数已是2015 年的20 倍。类似组织的发展反映了女性和学生等新的AI 参与群体也在增长。

4. 伦理问题
报告指出,在人工智能、机器学习、机器人相关的会议和期刊论文中,含有“伦理”相关关键词的论文占比虽小,但增长迅速。RightsCon 作为数字时代全球大型的人权年度峰会之一,自2017 年以来,已就人权与AI 问题的探讨有了初步进展,AI 伦理议题的焦点也从算法责任和基于人权的AI 方法扩展到算法偏见和歧视、隐私和数据权以及AI 在治理、选举、审查、贸易、就业等方面的作用。

三、技术性能
1. 计算机视觉
报告指出,依托特定数据集的建立和一些挑战赛的举办,AI 在图像分类、图像生成、语义分割、视频动态识别、多种数据类型的联合推理等方面取得了显著进展。例如,基于大型图像数据库ImageNet 的大规模视觉识别挑战赛的进展表明,基于云架构训练大型图像分类系统所需的时间从2017 年10 月的约3 个小时减少到了2019 年7 月的约88 秒(准确度达到93% 以上),图像分类的训练成本也大大下降。

2. 语言
报告指出,能够理解和分析自然语言是至关重要的多用途AI 技术问题。近年来,面向语言的AI 系统研究取得了巨大进步。在通用语言理解评估(General Language Understanding Evaluation,GLUE)测试和超级GLUE(SuperGLUE)测试中,Google、Facebook 发布的模型在通用语言理解上已接近人类基准。斯坦福问答数据集(Stanford Question Answering Dataset,SQuAD2.0)测试结果表明,AI 在自然语言处理方面的进展迅速。此外,艾伦人工智能研究所(Allen Institute for Artificial Intelligence,AI2) 的推理挑战赛(AI2 Reasoning Challenge,ARC) 和商用机器翻译(Commercial Machine Translation,CMT)系统的发展表明,AI 在推理、翻译等方面也有一定进展。

3. 计算能力
2012 年之前,人工智能的发展遵循摩尔定律,计算量每两年翻一番;2012 年之后,计算量每3.4 个月翻一番(已增长30万倍)。

4. 人类级表现里程碑
继2017 年首份AI 指数报告列出“人类级表现里程碑”(Human-Level Performance Milestones)清单之后,2019 年的报告对这一清单作了更新[3],概述了人工智能在人类或超人类级别执行的游戏成就、医疗诊断和其他复杂任务的代表性事件新增了“DeepMind 打造的Alphastar 在《星际争霸2》中击败顶级人类专业玩家”“以专家级的准确性检测糖尿病视网膜病变(Diabetic Retinopathy,DR)”两项。

四、经济
1. 就业
报告指出,人工智能领域的岗位需求无论在发达经济体还是新兴经济体中都在迅速增长。领英(LinkedIn)的数据显示,全球AI 招聘呈现快速增长趋势。2015—2019 年,新加坡、巴西、澳大利亚、加拿大和印度的AI 招聘数量增长最快。美国的AI 岗位需求比例从2012 年的0.3%增长到了2019 年的0.8%,其AI 岗位需求主要集中在机器学习、人工智能、神经网络、自然语言处理、机器人技术和视觉图像识别等集群,主要分布于信息技术服务、专业及科技服务、金融和保险、制造业、企业管理等领域。在AI 技能渗透方面,印度、美国、法国、中国和以色列是渗透率最高的五个国家,而软件和IT 服务、硬件和网络、教育、金融和制造业是渗透率最高的五个行业。报告还详细分析了美国各州、大都市区和城市的AI 岗位需求及技能渗透情况。

2. 投资
报告显示,2019 年,全球私人AI 投资超过700 亿美元,与AI 相关的创业投资超过370 亿美元,并购规模34 亿美元,首次公开发行(IPO)规模50 亿美元。美国、欧洲和中国在私人AI 投资方面所占份额排名靠前,美国一直是AI 资助的领先者和AI 初创企业投资的主导者,以色列、新加坡和冰岛的人均投资较为可观。2018—2019 年,AI 私人投资最多的是自动驾驶汽车,为77 亿美元(占比9.9%);增长最快的是机器人自动化(超过10 亿美元)。针对AI 初创企业的投资稳步增长,从2010 年的13 亿美元增长到了2018 年的404 亿美元,年均增长超过48%。获得投资的4403 家AI 初创企业分别来自36 个不同的重点领域,主要包括数据工具、时尚和零售技术、工业自动化、石油和天然气、金融科技和文本分析。其中,美国有1749 家初创企业共获得198 亿美元投资,中国有486 家初创企业获得总计166 亿美元投资,欧洲有993 家初创企业共获得46 亿美元投资,印度有139 家初创企业获得36 亿美元投资。人工智能似乎正在转变为通用技术。

在企业投资方面,2019 年由风险资本驱动的私人投资约占AI 总投资的一半,其余为并购和公开募股。但就交易数量而言,私人投资占92%,并购仅占4%,少数股权和首次公开发行共占3%。在公共投资方面,美国联邦政府2020 财年预计在AI研发上投资49.8 亿美元。其中,美国国防部(DoD)预算约40亿美元,较大的AI 资助实体是国防部长办公室(13 亿美元)、国防部高级研究计划局(DARPA,5.06 亿美元);联邦民用机构(非国防部)预计将在AI 上投资9.73 亿美元,美国国家科学基金会(NSF)为4.88 亿美元。

3. 企业活动
报告指出,企业的AI 应用正在增加,但因行业而异。麦肯锡2019 年的一项研究表明,58%的受访企业表示至少有一个职能或业务部门利用了AI,30%的受访者表示AI 已嵌入其多个业务领域,企业最有可能出于提升其行业核心价值的目的而利用AI,在各行业中应用最多的是机器人流程自动化、计算机视觉和机器学习,且相当一部分受访企业已针对合规性、网络安全、个人隐私等风险采取措施。

报告显示,2018 年,全球机器人安装量增长6%,达到422271 台,价值165 亿美元;现有运作的机器人存量约243.95万台,增长了15%。需求最大的仍是汽车行业(占安装总数的30%),其次是电气/ 电子(25%)、金属和机械(10%)、塑料和化学产品(5%)、食品和饮料(3%)。中国、日本、美国、韩国和德国的工业机器人安装量占全球总安装量的74%。自2013 年以来,中国一直是全球最大的工业机器人市场,2018 年安装量为154032 台,占全球总安装量的36%。

五、教育
1. 在线学习
报告指出,越来越多的AI 教育超出了实体大学的范围,在线学习在AI 教育和技能培训中发挥着关键作用。全球最大的高等教育在线平台Coursera 发布的2019 全球技能指数(Global Skills Index,GSI)报告,详细分析了全球60 个国家和地区10 个行业的商业、技术和数据科学方面的技能状况,包括AI 技能指数情况[4]。Coursera 的GSI 数据表明,东亚和南亚国家在AI 及相关技能方面的入学率较高,而一个国家的技能等级与其人均GDP 和高等教育投资水平等指标相关。优达学城(Udacity)的在线课程注册数据显示,深度学习、机器学习、人工智能及计算机系统工程等入门课程都比较热门。

2. 人才培养
报告显示,近年来,美国斯坦福大学、伯克利大学、伊利诺伊大学等的人工智能和机器学习等课程注册学生数均大幅增长,中国的清华大学和北京大学、加拿大的多伦多大学、澳大利亚的墨尔本大学等知名大学的相应课程也呈现出类似态势。欧洲的大学AI 教育大都以硕士水平授课,共有197 所大学提供总计406 个AI 专业硕士学位授予点。人工智能已迅速成为北美计算机科学博士生最受欢迎的专业,2018 年,超过21%的计算机科学博士毕业生专注于人工智能/ 机器学习的研究。美国和加拿大AI 领域的博士毕业生人数持续增长,超过了计划数的60%;2018 年,有150 多名AI 博士进入了产业领域,即将毕业的AI 博士进入产业界的比例从2004 年的21%增长到了2018年的62%以上。在美国,离开学术界去产业界的AI 教师人数持续增长。

3. 师资多元化
报告指出,在美国,按性别划分的AI 教职员工多元化并未取得显著进展。计算机科学终身制教师的总数一直稳步增长,但女性教师在其中的占比基本保持不变(21%),新教师的国际化比例也较小(18%)。2018 年,女性在新教职员工中所占比例不到20%;女性AI 博士学位获得者的比例自2010 年以来几乎保持不变,为20%。2010—2018 年,美国的AI 博士学位获得者中,来自国外的博士数量从不到40%增长到了60%以上,这些毕业生只有18% 进入了学术界。此外,与AI 相关的大学终身教职或终身教授存在前所未有的人才外流现象。

4. 伦理课程
报告指出,随着AI 的兴起,在计算机科学课程中设计并讲授伦理规范具有紧迫性。常见的计算机伦理课程设置有两种方法:①设计独立的伦理课程,即将伦理与计算机及AI 等结合起来的单独课程,如“计算机科学和伦理学”“人工智能和伦理”。②将伦理模块(或内容)纳入核心计算机科学或人工智能课程的全流程。一些大学正在努力将两者融合。

六、自动系统
1. 自动驾驶汽车
报告指出,目前全球范围内至少25 个国家或地区的城市正在测试自动驾驶汽车(Autonomous Vehicles,AV)原型。加利福尼亚州是美国第一个制定自动驾驶汽车测试法规的州。自2012 年以来,美国至少有41 个州和哥伦比亚特区考虑了与AV 有关的立法。2015—2018 年,加利福尼亚州测试自动驾驶汽车的企业总数增长了7 倍。2018 年,加利福尼亚州为50 多家企业和500多个AV 提供了测试许可,这些AV 总计行驶了约321.9 万千米(200 万英里)。然而,自动驾驶汽车的安全和可靠性是一个大问题。

2. 自主武器
最近的一项调查发现,至少有89 个国家的武器库中有自动防空系统,63 个国家部署了不止一种防空系统,而自主保护(Active Protection,AP)系统仅由9 个已知的生产国开发和制造。已知全球范围部署的自主武器(Autonomous Weapons,AW)系统数量排名中,美国最多,其次是以色列、俄罗斯、法国、中国、意大利等。

七、公众认知
1. 银行
报告显示,从各国中央银行的通讯文件可以看出,世界各地的中央银行都对AI 表现出了浓厚的兴趣。英格兰银行围绕AI 及区块链和加密货币的使用制定了明确的研究议程,美联储和日本央行等国家的中央银行也开始围绕AI 构建正式的研究议程。

2. 政府
报告指出,政府官员越来越重视人工智能。与往年相比,2017—2018 年,各国国会的有关报告及立法中涉及AI 及相关内容的频次增加了10 倍以上。美国国会的相关笔录中,2019年是迄今为止AI 提及率最高的一年。近年来,加拿大、英国等国家的国会报告、委员会报告和立法中,与人工智能相关的内容都有显著增加。

3. 企业
报告显示,美国3000 家上市公司财报当中,提及AI 收益的比例大幅增加,已从2010 年的0.01%增至2018 年的0.42%。在各行业2018—2019 年第一季度的财报中,金融业提及AI 的数量最多,其次是电子技术、生产商制造、医疗保健技术和技术服务部门。

4. 网络搜索和新闻报道
报告指出,从美国用户使用Google 搜索AI 相关关键词的热度和趋势来看,2008—2013 年最热的是“云计算”,2013—2016 年最热的是“大数据”,近几年最热的是“机器学习”,其次是“数据科学”。在全球范围的相关新闻报道中,“人工智能”无疑是最热的赢家,其次是“机器学习”、“深度学习”,以及“AI与工作或就业”。

八、社会伦理
1. 伦理挑战
报告指出,人工智能系统引发了各种道德和伦理挑战。一些AI 伦理框架文件提到的伦理挑战主要包括问责制、安全、人类控制、可靠性和安全性、公平性、多元化和包容性、可持续发展、透明度、可解释性、多方参与、法律与合规、数据隐私。其中,公平性、责任制、可解释性和透明度等是最常被提到的伦理问题。

2. 新闻媒体报道
报告指出,人工智能的全球新闻报道已越来越多地关注AI使用的伦理问题讨论。2018—2019 年确定的3600 多篇有关伦理与人工智能的全球新闻中,主题主要涉及人工智能使用的伦理框架和准则、数据隐私、面部识别的使用、算法偏见以及大技术角色。2019 年关于AI 伦理的全球媒体对话主要涉及AI 伦理框架问题。

3. 可持续发展
报告指出,目前的人工智能应用案例对联合国所有17 个可持续发展目标(Sustainable Development Goals,SDGs)均具有适用性,但只能帮助解决169 个细分目标中约一半的目标。为了使AI 发挥其潜在的作用和影响,需要克服一些特定的瓶颈,如数据本身的可用性、质量和集成等挑战,计算能力、AI 人才等方面的限制等。

九、国家战略和全球AI 活力
1. 国家战略
报告显示,过去几年,各国关于AI 的战略性文件的数量一直在增加,各国纷纷推出并实施新的AI 战略。在报告搜集的48 份AI 战略文件中,94%的文件包含“学术伙伴关系”,48%包含AI 研发,超过42%提到AI 治理,而较少有文件提及保护消费者和促进公平。

2. 全球AI 活力
报告总结和介绍了衡量全球AI 活力(Global AI Vibrancy)的工具、方法及结果[5]。该工具自2015 年起使用,涵盖28 个国家或地区,包括研发、经济、包容性三个一级指标和34 个具体指标,指标数值为0—100,以衡量特定国家或地区在特定指标下的全球分布中的相对位置,并可根据使用者的权重偏好进行跨国比较和长期比较。

注释:
[1] 此处的AI 论文对应于AI 领域的所有出版物,包括Elsevier 的Scopus文献数据库中的期刊出版物和会议出版物。
[2] arXiv 是一个免费分发服务和公开获取存档的文献平台,在该平台上发表的论文通常是未经同行评审的电子预印本,涵盖物理学、数学、计算机科学、统计学、电气工程和系统科学以及经济学等领域。
[3] 完整的“人类级表现里程碑”清单详见报告原文。
[4] 完整的2019 全球技能指数及AI 技能指数情况详见:https://www.coursera.org/gsi/。
[5]详见报告原文及相关链接:vibrancy.aiindex.org。

编译:巩玥 王鹏飞 曹学伟
编辑部成员:张丽琴 王国强 刘薇 王达 曹学伟 苗晶良

公众号对话框回复关键字“AI指数”,获取报告全文PDF。

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存